نوشته شده توسط : علی محمد
پاورپوینت-یادگیری-تقویتی
پاورپوینت یادگیری تقویتی
فرمت فایل دانلودی: .rar
فرمت فایل اصلی: pptx
تعداد صفحات: 23
حجم فایل: 61
قیمت: 2000 تومان

بخشی از متن:
در یک مسئله یادگیری تقویتی با عاملی روبرو هستیم که از طریق سعی و خطا با محیط تعامل کرده و یاد میگیرد تا عملی بهینه را برای رسیدن به هدف انتخاب نماید.
یادگیری تقویتی از اینرو مورد توجه است که راهی برای آموزش عاملها برای انجام یک عمل از طریق دادن پاداش و تنبیه است بدون اینکه لازم باشد نحوه انجام عمل را برای عامل مشخص نمائیم.
دو استراتژی اصلی برای اینکار وجود دارد:
یکی استفاده از الگوریتم های ژنتیکی
و دیگری استفاده از روشهای آماری و dynamic programming
در RL روش دوم مد نظر است.

محیط مجموعه ای از S حالت ممکن است.
در هر لحظه t عامل میتواند یکی از A عمل ممکن را انجام دهد.
عامل ممکن است در مقابل عمل و یا مجموعه ای از اعمالی که انجام میدهد پاداش r را دریافت کند. این پاداش ممکن است مثبت و یا منفی )تنبیه(باشد
عامل در محیط حرکت کرده و حالتها و پاداشهای مربوطه را به خاطر می سپارد.
عامل سعی میکند طوری رفتار کند که تابع پاداش را ماکزیمم نماید.
مقایسه RL با یادگیری با ناظر
Exploitation versus Exploration
Dynamic Programming
اجزا یک سیستم یادگیری تقویتی
The Environment
The Reinforcement Function
مدلهای عملکرد بهینه
یادگیری خط مشی

دانلود فایلپرداخت با کلیه کارتهای عضو شتاب امکان پذیر است.
 




:: برچسب‌ها: مقایسه RL با یادگیری با ناظر,Exploitation versus Exploration,Dynamic Programming,اجزا یک سیستم یادگیری تقویتی,The Environment,The Reinforcement Function,مدلهای عملکرد بهینه,یادگیری خط مشی,پاورپوینت یادگیری تقویتی, یادگیری تقویتی ,
:: بازدید از این مطلب : 138
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : شنبه 2 دی 1396 | نظرات ()
مطالب مرتبط با این پست
لیست
می توانید دیدگاه خود را بنویسید


نام
آدرس ایمیل
وب سایت/بلاگ
:) :( ;) :D
;)) :X :? :P
:* =(( :O };-
:B /:) =DD :S
-) :-(( :-| :-))
نظر خصوصی

 کد را وارد نمایید:

آپلود عکس دلخواه: